该报告分析了共14个变量,57356条数据。
## [1] 57356 14
## 'data.frame': 57356 obs. of 14 variables:
## $ ListingKey : Factor w/ 113066 levels "00003546482094282EF90E5",..: 7180 6647 6720 6731 6812 7056 7161 7170 6825 6827 ...
## $ ListingCreationDate : Factor w/ 113064 levels "2005-11-09 20:44:28.847000000",..: 14184 6429 15374 100485 53246 2704 16841 73145 69285 33837 ...
## $ CreditGrade : Ord.factor w/ 8 levels "NC"<"HR"<"E"<..: 5 2 5 6 2 8 4 4 3 7 ...
## $ Term : int 36 36 36 36 36 36 36 36 60 36 ...
## $ LoanStatus : chr "Completed" "Completed" "Completed" "Defaulted" ...
## $ BorrowerRate : num 0.158 0.275 0.133 0.143 0.318 ...
## $ ListingCategory..numeric.: int 0 0 0 1 13 0 0 15 1 1 ...
## $ Occupation : Factor w/ 68 levels "","Accountant/CPA",..: 37 37 68 50 37 43 43 52 49 21 ...
## $ EmploymentStatusDuration : int 2 NA 19 1 121 NA 36 3 25 10 ...
## $ DelinquenciesLast7Years : int 4 0 1 0 0 0 5 0 0 0 ...
## $ DebtToIncomeRatio : num 0.17 0.06 0.27 0.18 0.49 0.12 0.09 0.39 0.11 0.26 ...
## $ IncomeRange : Factor w/ 8 levels "$0","$1-24,999",..: 4 7 2 4 5 7 4 4 4 6 ...
## $ LoanOriginalAmount : int 9425 3001 1000 4000 4000 10000 3000 2000 4000 4000 ...
## $ LoanOriginationDate : Date, format: "2007-09-12" "2007-01-17" ...
贷款的信用评级分布较平均,各等级间的数量差距不明显。
Prosper平台上的贷款以中长期为主,且三年期占绝大多数。
Prosper平台上的违规率在33.2%左右,还是蛮高的。
平台上的借款利率多集中在0.06至0.35这个区间。贷款利率似乎与贷款期限关系不明显,未出现如经验判断的“期限越长,利率越高”。
大部分人在申请贷款时选择了1-Debt Consolidation,有可能是默认项,猜测借款用途可能没有分析意义。
大部分借款人在过去7年的违约次数是0,说明Prosper平台借款人的信用状况较好。
95%的借款人的负债收入比小于0.5,说明Prosper平台借款人的资质较好。
大部分借款人的月收入在25000至50000区间。
Prosper平台上选择“Other”的借款人最多,说明很多人并没有选择真实的职业。
见报告开头
没有
做了一些清理和整洁方面的操作,可以参照上面的代码
平台信用评级越高的人,违约的可能性越低。符合人们经验的判断。
违约贷款的利率明显高于按时还款的部分。一方面,贷款利率高是由于用户自身的资质差;另一方面,高利率又使得用户更加难以承受而违约。
随着年收入的增加,违约比例在逐渐下降。
随着工作年限的增长,违约率逐渐下降。
债务收入比越低的人更具有还款能力,平台整体的用户债务收入比小于0.6,资质很好。
信用评分越高,利率越低,违约率也越低;反之信用评分越高,利率也越高,违约率也越高。
信用评级越高,贷款金额越小,违约率也越低;在相同的信用评级上,随着贷款金额的增加,违约率也在提高。
贷款期限越短,利率越低,违约率也越低;相同的利率下,贷款期限越短,违约率越低。
收入越高,贷款利率越低,违约率也略低;相同利率下,收入越高,违约率越低。
信用评级越高,贷款金额越小,违约率也越低;在相同的信用评级上,随着贷款金额的增加,违约率也在提高。
信用评级越高,违约率就越低;相反的信用评级越低,越会出现违约的情况。
信用评级越高,借款利率越低,违约率也越低;相同利率下,信用等级越高,违约率越低。
在理解数据变量信用评级CreditGrade的时候,注意到在2009年7月这个时间点前后,使用的变量发生了改变,在2009年7月之前使用的是 CreditGrade,而之后则使用了ProsperRating..Alpha.;这个我处理的方式是将2009年7月之后的信用评级变量CreditGrade使用ProsperRating..Alpha.来填充。
希望能收集到更多的一年期限的数据,这样可能更好看的是否一年期贷款的还款率更好,这样更有利于指导公司是否应该去引导很多的用户选择一年期的贷款。